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Beschreibung 



Vorrichtung und Verfahren zur Gerauschunterdruckung in Fern- 
sprecheinrichtungen 

Die vorliegende Erfindung betrifft eine Vorrichtung und ein 
Verfahren zur Gerauschunterdruckung in Fernsprecheinrichtun- 
gen. 

Insbesondere betrifft die vorliegende Erfindung eine solche 
Vorrichtung und ein solches Verfahren zur Verwendung in Fern- 
sprecheinrichtungen mit Freisprecheinrichtung und mit einer 
Pegelwaage . 

Im Stand der Technik sind bereits Vorrichtungen und Verfahren 
zur Gerauschunterdruckung in Fernsprecheinrichtungen, insbe- 
sondere mit Freisprecheinrichtung mit einer Pegelwaage be- 
kannt. Diese Vorrichtungen weisen jedoch den Nachteil auf, 
dafi die dort verwendeten Echounterdruckungen entweder sehr 
empfindlich gegen Storgerausche sind (durch Storgerausche auf 
Seiten des f reisprechenden Gesprachsteilnehmers wird auf Ge- 
gensprechen erkannt, obwohl der f reisprechende Teilnehmer zur 
Zeit nicht spricht) , zum anderen weisen mit entsprechenden 
Gerauschunterdruckungs f iltern versehene Vorrichtungen gemafl 
dem Stand der Technik eine erhebliche Lauf zei tver zogerung 
auf, Diese ist zwar in manchen Standards zulassig (beispiels- 
weise bei -GSM oder Videokonf erenzanwendungen) , beim normalen- 
Festnetzbetrieb ist die entsprechende Lauf zei tverzogerung je- 
doch zu groii . 

Es ist daher die Aufgabe der vorliegenden Erfindung, eine 
solche Vorrichtung und ein solches Verfahren dergestalt wei- 
terzubilden, dafl Nebengerausche wesentlich besser unterdruckt 
werden, und trotzdem keine unzulassig hohen .Signalverzogerun- 
gen entstehen . 
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Erf indungsgemaii wird diese Aufgabe durch eine entsprechende 
Vorrichtung gelost, bei der im Sendepfad der Fernsprechein- 
richtung ein zusatzliches Filter mit extrem kurzer Laufzeit 
angeordnet ist. 

5 

Es ist dabei weiter bevorzugt, auch im Empf angspf ad der Fern 
sprecheinrichtung ein solches zusatzliches Filter mit extrem 
kurzer Laufzeit anzuordnen. 

10 Das oder die zusatzlichen Filter sollten dabei eine Gruppen- 
laufzeit von < 2 ms aufweisen. 

Um eine bessere Anpassung an wechselnde Storgerausche zu er- 
reichen, ist es besonders bevorzugt, daii das oder die zusatz- 
15 lichen Filter einstellbare Koef f izienten aufweisen und eine 
Steuerschaltung zur Einstellung der Koef f izienten vorgesehen 
ist . 

Eine besonders geringe Signallauf zeit lafit sich vorzugsweise 
20 dadurch erzielen, daii das oder die zusatzlichen Filter im 
Vollbandbereich arbeiten, wahrend die Steuerschaltung zur 
Koef f izenteneinstellung im Teilbandbereich arbeitet. 

Um eine hohe Frequenzselektivitat wegen der leistungsstarken 
25 niederf requenten Signalanteile bei Sprache und gleicht zeit ig 
eine moglichst geringe Laufzeit der Koef f izienteneinstellung 
zu erzieienv i-st"-es-besonders--bevorzugt7"in^ 

tung das Eingangssignal mit einer DFT-modulierten Polyphasen- 
filterbank mit phasenminimalem Prototyptiefpafif ilter zu ver- 
30 binden. 

Zur Verbesserung von Nebengerauschen ist es besonders bevor- 
zugt, die unterabgetasteten Ausgangssignale der Polyphasen- 
Filterbank an eine Kur zzeitleistungsschat zungsvorrichtung an 
35 zuschlieiien , 
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Dabei ist es besonders bevorzugt, die Ausgange der Kurzzeit- 
leistungsschatzungsvorrichtung, die die Schatzwerte der Teil- 
bandleistungen tragen, mit einer Vorrichtung zur Schatzung 
der Leistungen des Hintergrundgerausches und einer Vorrich- 
tung zur psychoakustischen Gewichtung der gestorten Teilband- 
leistungen zu verbinden. 

Weiter ist es bevorzugt, die Ausgange der Vorrichtung zur 
Schatzung der Leistungen des Hintergrundgerausches iiber eine 
Vorrichtung zur nichtlinearen Anhebung der Gerauschsignale 
und die Ausgange der Vorrichtung zur psychoakustischen Ge- 
wichtung direkt mit einer Vorrichtung zur Berechnung der 
Teilbandgewichtungsf aktoren zu verbinden. 

Weiter ist es bevorzugt, die Ausgange der Vorrichtung zur Be- 
rechnung der Teilbandgewichtungsf aktoren mit einer Vorrich- 
tung zu einer modif izierten inversen diskreten Fouriertrans- 
formation zu verbinden, deren Ausgang mit dem Koef f izienten- 
eingang des oder der zusatzlichen Filter verbunden ist. 

Es ist dabei weiter bevorzugt, daft zumindest ein Teil der 
Ausgange der Kurzzeitleistungsschatzungsvorrichtung mit einer 
Vorrichtung zum Dampf ungsausgleich verbunden sind, deren Aus- 
gang mit einem Steuereingang der Vorrichtung zur Berechnung 
der Teilbandgewichtungsf aktoren verbunden ist. 

Im Hinblick auf die-Reduzierung der Signalverzogerung ist es 
besonders bevorzugt, dafi es sich bei dem oder den zusatzli- 
chen Filtern urn kurze Transversal filter handelt, vorzugsweise 
mit einer sehr geringen Ordnung von < 20. 

Zur Losung der o.g. Aufgabe lehrt die vorliegende Erfindung 
auch ein gattungsgemalies Verfahren, bei dem das Sendesignal 
der Fernsprecheinrichtung einer zusatzlichen Filterung mit 
sehr geringer Laufzeit unterworfen wird. 
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Es ist dabei besonders bevorzugt, auch das Empf angssignal der 
Fernsprecheinrichtung einer solchen zusatzlichen Filterung 
mit sehr geringer Laufzeit zu unterwerfen. 

5 Im Hinblick auf die Anf orderungen an Festnet ztelef onverbin- 
dungen ist es besonders bevorzugt, dafi die Gruppenlauf zeit 
fur die zusatzlichen Filterungen auf weniger als 2 ms einge- 
stellt wird. 

10 Es ist dabei besonders bevorzugt, dafi die Filterung mittels 
kurzer Transversalf ilter durchgefuhrt wird, deren Ordnung 
vorzugsweise kleiner als 20 ist. 

Es ist dabei besonders bevorzugt, dafi die Transversalf ilter 
15 mit einstellbaren Koef f izienten gesteuert werden, die fur 
beide Transversalf ilter auf die gleiche Weise eingestellt 
werden . 



Eine besonders schnelle und rechenzeitef f ektive Verarbeitung 
20 lafit sich vorzugsweise dadurch erzielen, dafi die Filterung im 
Vollbandbereich durchgefuhrt wird, wahrend die Bestimmung der 
Koef f izienten im Teilbandbereich durchgefuhrt wird. 



Vorzugsweise werden mehrere, unterschiedliche Abtastraten in 
25 nerhalb des Verfahrens verwendet. 

- Er f±ndungsgemafi""ist e~s^bels _ on~ders"" bevoTziigt"," "die "Best immuhg 
der Koef f izienten mittels einer Teilbandanalyse und einer 
Rucktransf ormation mittels einer modif izierten inversen dis- 
30 kreten Fouriertransf ormation durchzufiihren. 




Dabei wird die modifizierte inverse die Fouriertransf ormation 
vorzugsweise auf die Teilbandf ilterkoef f izienten angewendet. 

35 Es ist dabei besonders bevorzugt, die Teilbandanalyse mittels 
einer Filterbank in Frequenzteilbandern zu implementieren . 
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Die Filterbank wircl dabei vorzugsweise als mittels digitaler 
Fouriertransf ormation modulierte Polyphasenf ilterbank mit 
phasenminimalem Prototyptiefpaftf ilter ausgef uhrt . 

Es ist dabei besonders bevorzugt, dali bei der Bestimmung der 
Koef f izienten zusatzlich eine Kurzzeitleistungsschatzung mit- 
tels nichtlinearer Betragsglattungen der Teilbandsignale 
durchgef tihrt wird. 

Vorzugsweise erfolgt bei der Bestimmung der Koef f izienten zu- 
satzlich eine psychoakustische Gewichtung der geschatzten 
Summensignalleistungen. 

Weiter ist es vorteilhaft, bei der Bestimmung der Koeffizien- 
ten zusatzlich eine nichtlineare Anhebung der Gerauschlei- 
stungen durchzuf uhren . Dadurch konnen vorteilhaf terweise ver- 
f ahrensbedingte Storgerausche, sogenannte "Musical tones" 
verhindert werden . 

Damit nicht der Eindruck entsteht, der feme Sprecher wurde 
bei Einsetzen von Storgerauschen plotzlich leiser sprechen, 
ist es bevorzugt, bei der Bestimmung der Koef f izienten zu- 
satzlich eine automatische Verstarkungssteuerung zu verwen- 
den, welche die Filterkoeff izienten so gewichtet, dafi das ge- 
rauscherftillte und das gerauschreduzierte Signal ein nahe- 
rungsweise gleiches Lautheitsempf inden hervorrufen. 

Im Unterschied zu bisherigen Verfahren hat die vorliegende 
Erfindung den groiien Vorteil, daii lediglich eine sehr geringe 
Signalverzogerung erfolgt und fur das Gesamtver f ahren nur ein 
relativ geringer Rechenaufwand erforderlich ist. 

Die vorliegende Erfindung wird im folgenden anhand der beige- 
fiigten Zeichnungen naher erlautert, Es zeigt: 

Fig. 1 das Modell einer Freisprecheinrichtung; 
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Fig. 2 eine ausf uhrlichere Darstellung mit den jeweils auf- 
tretenden lokalen und fernen Hintergrundgerauschen; 

Fig. 3 eine Ubersichtsdarstellung einer erf indungsgemalien 
Freisprecheinrichtung; 

Fig. 4 die Dampf ungsanf orderungen in Abhangigkeit von der 
Echolauf zeit ; 

Fig. 5 eine Ubersichtsdarstellung einer erf indungsgemalien Ge- 
rauschunterdruckung; 

Fig. 6 ein gemitteltes Sprachspektrum deutscher Sprecher; 

Fig. 7 die Struktur einer erf indungsgemalien Analysef ilter- 
bank; 

Fig. 8 eine schematische Darstellung der erf indungsgemalien 
psychoakustischen Gewichtung; 

Fig. 9 eine er f indungsgemalie Berechnungsstruktur der Ge- 
rauschleistungsschatzung in einem Teilband; und 

Fig. 10 den beispielhaf ten Verlauf einer erf indungsgemalien 
T e i lbanddamp f ung ; und 

Fig. II die 'Berechnungs form fiir" die erf indungsgemalien- 'Filter 
koef f izienten . 

In Fig. 1 ist ein vereinf achtes Modell einer Freisprechein- 
richtung 10 mit Anschluli an eine digitale Verbindung 12 dar- 
gestellt. Die im europaischen ISDN-Net z verwendete A-Law- 
Codierung bzw. Decodierung ist in den beiden linken Blocken 
14, 16 dargestellt. Auf der rechten Seite ist das Lautspre- 
cher-Raum-Mikrophonsystem 18 (LRM-System) mit dem lokalen Ge 
sprachsteilnehmer 20, dem Benutzer der Freisprecheinrichtung 
skizziert . 
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Durch die akustische Kopplung zwischen Lautsprecher und Mi- 
krophon kommt es zum Ubersprechen iiber das LRM-System. Dieses 
Ubersprechen wird vom fernen Teilnehmer als storendes Echo 
wahrgenommen. Akustische Wellen treten dabei aus dem Laut- 
sprecher aus und breiten sich im Raum aus. Durch Reflexion an 
den Wanden und anderen sich im Raum befindlichen Gegenstanden 
entstehen mehrere Ausbreitungspf ade, durch die unterschiedli- 
che Laufzeiten des Lautsprechersignals entstehen. Das Echosi- 
gnal am Mikrophon besteht somit aus der Uberlagerung einer 
Vielzahl von Echoanteilen und ggf. dem Nutzsignal n(t): dem 
lokalen Sprecher. 

In Fig. 2 ist ein erweitertes Modell einer Fernsprechverbin- 
dung dargestellt. Das bisherige Modell (Fig. 1) wurde dabei 
urn den Teil des fernen Gesprachsteilnehmers 120 erganzt. Dar- 
gestellt ist eine ISDN-Verbindung 12, wobei auf der lokalen 
Seite eine Freisprecheinrichtung 10 verwendet wird. Der feme 
Teilnehmer telefoniert mit einem Handapparat . Besonderes Au- 
genmerk wurde auf die jeweiligen Hintergrundgerausche gelegt. 

Auf der Seite mit der Freisprecheinrichtung wurden vom Mikro- 
phon nicht nur die Sprache des lokalen Gesprachsteilnehmers 
(das eigentliche Nutzsignal), sondern auch Echoanteile des 
fernen Sprechers und lokale Hintergrundgerausche aufgenommen. 
Beispiele fur solche Gerauschquellen innerhalb von Buroraumen 
sind .PC-Luf ter oder Klimaanlagen . Beide- si-nd- im unteren Teil - 
der Fig. 2 skizziert. Verwendet der lokale Sprecher die Frei- 
sprecheinrichtung in Kraf tf ahrzeugen (GSM-Verbindung) , so 
konnen Fahrtwind-, Roll- oder Motorgerausche die Verstand- 
lichkeit der Sprachanteile im Mikrophonsignal verschlechtern . 
Aufgabe einer digitalen Signalverarbeitung innerhalb der 
Freisprecheinrichtung sollte eine Verbesserung der Sprachqua- 
litat des zu sendenden Signals sein. 

Auch auf der fernen Seite konnen sich storende Hintergrundge- 
rausche dem Sprachsignal des Gesprachsteilnehmers uberlagern, 
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obgleich diese bedingt durch die Bauart eines Handapparates 
leiser sind als im Freisprechf all . Bevor das Signal des fer- 
nen Sprechers 120 auf dem Lautsprecher beim lokalen Teilneh- 
mer 2 0 ausgegeben wird, kann auch hier versucht werden, die 
Sprachqualitat dieses Signals zu verbessern. Durch die zwi- 
schen der Gerauschentstehung und Gerauschunterdruckung lie- 
gende Verbindung - einschliefilich der Codierung und Decodie- 
rung - ist zu erwarten, daft dieser Teil der Gerauschunter- 
druckung schwieriger zu realisieren ist, als die lokale Ge- 
rauschreduktion. Bei diesem Teil der Gerauschunterdruckung 
kann gewahlt werden, ob das Verfahren lediglich im Steue- 
rungspfad der Pegelwaage ( zur Vermeidung von fehlerhaften 
Sprachdetektionen) oder aber im Signalpfad plaziert werden 
soil . 

In Fig. 3 ist eine Ubersicht einer erf indungsgemafien Frei- 
sprecheinrichtung dargestellt. Zentrales Element des Verfah- 
rens ist eine Pegelwaage 22, welche im linken Teil der Fig. 3 
dargestellt ist. Optional konnen zwei Verstarkungssteuerungen 
24, 2 6 (Automatic Gain Control = AGO in den Sende- und den 
Empfangspfad eingeschaltet werden. Die Pegelwaage garantiert 
die durch die ITU-T- bzw. ETSI-Empf ehlungen vorgeschriebenen 
Mindestdampfungen, indem sie abhangig von der Gesprachssitua- 
tion Dampfungen in den Sende- und/oder den Empfangspfad ein- 
ftigt. Bei Aktivitat des fernen Teilnehmers wird der Empfangs 
pfad freigeschaltet und das Signal des fernen Teilnehmers 
wird ungedampft auf— dem -Lautsprecher -ausgegeben — Die^ bei" ab- 
geschalteten oder schlecht abgeglichenen Kompensatoren ent- 
stehenden Echos werden durch die in den Sendepfad eingefugte 
Dampfung stark verringert. Bei Aktivitat des lokalen Spre- 
chers kehrt sich die Situation urn. Wahrend der Empfangspfad 
stark bedampft wird, fugt die Pegelwaage 22 in den Sendepfad 
keine Dampfung ein und das Signal des lokalen Sprechers wird 
ungedampft ubertragen. Schwieriger wird die Steuerung der Pe- 
gelwaage 22 im Gegensprechfall. Hier erhalten beide Pfade 
(und damit auch die Teilnehmersignale ) jeweils die Halfte de] 
einzufugenden Dampfung oder bei nicht optimaler Steuerung 
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wird zumindest einer der beiden Signalpfade gedampft. Gegen- 
sprechen ist damit nicht oder nur eingeschrankt moglich. 

Abhilfe schafft hier der Einsatz von adaptiven Echokompensa- 
5 toren 28 - dargestellt im rechten Teil der Fig. 3. Diese ver- 
suchen, das LRM-System digital nachzubilden, urn dann den 
Echoanteil des fernen Teilnehmers aus dem Mikrophonsignal 
herauszurechnen. Je nachdem, wie gut die Kompensatoren dies 
bewerkstelligen, kann die durch die Pegelwaage 22 einzufugen- 
10 de Gesamtdampfung reduziert werden. 

In Freisprecheinrichtungen rait Gerauschreduktion gemaB dem 
Stand der Technik wird die Laufzeit hauptsachlich von der ge- 
rauschreduzierenden Komponente bestimmt. In Fig. 4 sind die 
15 Ergebnisse einer Studie dargestellt. Hier wurde versucht, 

herauszuf inden, welche Echodampf ung abhangig von der Laufzeit 
dieses Echos notwendig ist, damit 90, 70 bzw. 50 Prozent der 
Befragten mit der Gesprachsqualitat zufrieden sind. 

20 Basierend auf dieser Studie sind die Anf orderungen, die an 
Freisprechsysteme mit Gerauschunterdrlickungsverf ahren ge- 
stellt werden, aufgrund der grofieren Laufzeit hoher als die 
Anf orderungen an herkommliche Freisprechtelef one . 




Da die Echokompensatoren in ihrer Leistungsf ahigkeit begrenzt 
sind und derart hohe Echodampf ungen mit der zur Verfiigung 



stehenden Hardware nicht erreichen konnen, .wurde ein sog. 
Postfilter 30 eingefiihrt. Eine detaillierte Beschreibung 
hierzu befindet sich in DE-A-198 06 015. 

30 

Zur Unterdruckung storender Hintergrundgerausche werden zwei 
kurze Transversalf ilter 31, 33 in den Sende- und in den Emp- 
fangspfad der Freisprecheinrichtung geschaltet. Das Filter 33 
im Sendepfad soil lokale Hintergrundgerausche reduzieren. Da- 
35 mit wird zum einen die Sprachqualitat des Sendesignals erhoht 
- zum anderen verringert sich die Wahrscheinlichkeit einer 
fehlerhaften Offnung des Sendekanals durch die Pegelwaage 22. 
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Das Filter 31 im Empf angspf ad soil bei Gesprachssituationen, 
in denen auch das feme Teilnehmersignal verrauscht ist, dxe 
Sprachqualitat dieses Signals verbessern. Beide Filter 31, 33 
wurden so entworfen, dafi die Gruppenlauf zeit gering ist und 
kleiner oder gleich 2 ms betragt. Sollte die Freisprechein- 
richtung keine weiteren Verzogerungen enthalten, kann somit 
die ITU-T-Empfehlung G. 167 fur Festnetztelef one in bezug auf 
die Laufzeit (bei Verwendung nur eines Gerauschunterdruk- 
kungsfilters im Signalpfad) eingehalten werden. Der gesamte 
Rechenaufwand fur dieses Verfahren liegt bei weniger als zwei 
MIPS pro Filter ( zugrundegelegt wurde der Signalprozessor 
Siemens SPC) , was eine Anwendung selbst auf einfachsten Si- 
gnalprozessoren ermoglicht. 

Im folgenden wird zunachst ein Uberblick uber das erfindungs- 
gemaBe Verfahren zur Sprachverbesserung gegeben. Anschliefiend 
werden der Stand der Technik in bezug auf einkanalige Ge- 
rauschunterdriickungsverfahren sowie die Unterschiede zu dem 
erf indungsgemaJien Verfahren beschrieben. 

In Fig. 5 ist die Struktur der erf indungsgemaJien Gerauschun- 
terdruckung dargestellt. Die beiden Filter 31, 33 (im Sende- 
und Empfangspfad) werden mit dem gleichen Algorithmus einge- 
stellt. Die eigentliche Signalf ilterung erfolgt durch ein 
kurzes (derzeit 16 Koef f izienten langes) Transversalf ilter, 
welches im oberen Teil der Fig. 5 dargestellt ist. Bei einer 
Abt astrat e von -8- kHz- wird dami -t- eine - Ver zogerung- von -maximal 
2 ms (bei 16 Koef f izienten) in den Signalpfad eingefuhrt. 

Fur die Einstellung der Filterkoeff izienten wird zunachst ei- 
ne Teilbandanalyse des Eingangssignals durchgef iihrt . Hierbei 
wird eine DFT-modulierte Polyphasenf ilterbank 130 mit phasen- 
minimalem Prototyptiefpafif ilter eingesetzt. Die Phasenminima- 
litat des Prototyptiefpafif ilters garantiert eine moglichst 
geringe Analyseverzogerung - Polyphasenf ilterbanke konnen 
selbst auf einfachsten Signalprozessoren mit geringem Rechen- 
aufwand implementiert werden. Die Ausgangssignale der Filter- 
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bank werden unterabgetastet einer Kur zzeitleistungsschat zung 
132 zugefuhrt. Aus diesen Schatzwerten der Teilbandleistungen 
werden zum einen die Leistungen des Hintergrundgerausches ge- 
schatzt (unterer Teil der Fig. 5) , zum anderen erfolgt eine 
5 psychoakustische Gewichtung 134 der gestorten Teilbandlei- 
stungen. Diese Gewichtung 134 soil Verzerrungen, welche sich 
durch die Gerauschunterdriickung ergeben, moglichst gering 
halten. Die Gerauschschatzungen werden ebenfalls nichtlinear 
angehoben. Dies hat den Zweck der Vermeidung sog. "musical 
0 tones". Eine genaue Beschreibung dieses Effekts befindet sich 
in "P. Vary: Noise suppression by spectral magnitude estima- 
tion - mechanism and theoretical limits, Signal Processing 8, 
Seite 387 - 400, 1985". 

5 Aus den modif izierten Schatzungen der Summensignalleistungen 
und der Gerauschleistungen werden gemaJJ einer nichtlinearen 
Verarbeitung die Teilbandgewichtungsf aktoren bestimmt. Hier- 
bei wird versucht, eine gleiche Lautheit des verrauschten und 
des gerauschreduzierten Signals zu erreichen. Eine Teilfunk- 
0 tion 136 mit der Bezeichnung Dampf ungsausgleich versucht da- 
her Signalanteile mit moglichst groiiem Signal-Storungs-Ab- 
stand im Zeit-Frequenz-Bereich zu finden und basierend auf 
diesen Signalanteilen die Koef f izienteneinstellung so zu mo- 
difizieren, dali die gleiche Lautheit des ungestorten und des 
gestorten Signals erreicht wird. 

Die erhaltenen Teilbandgewichtungsf aktoren- werden mittels ei- 
ner modif izierten inversen DFT 138 in den Zeitbereich zurtick- 
transf ormiert . Hierbei wird eine Filterimpulsantwort im Ge- 
0 samtband generiert. Von der Moglichkeit der Rucktransf ormati- 
on der gewichteten Teilbandsignale wird aufgrund der hierfur 
notwendigen phasenmaximalen Synthesef ilterbank und der damit 
verbundenen Laufzeit abgesehen. 

5 Verfahren zur Gerauschunterdriickung gemaB dem bisherigen 

Stand der Technik lassen sich grundsat zlich in drei Klassen 
einteilen : 
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10 



25 



Verfahren, basierend auf DFT-Zerlegungen 

Hier wird das Eingangssignal in Blocke unterteilt, diese 
werden dann mittels einer DFT in den Frequenzbereich 
transformiert. Im Frequenzbereich wird die eigentliche 
Gerauschunterdruckung durchgef uhrt . Mittels des "Over- 
add-" Oder des "Overlap-save-Prinzips" werden die Blocke 
wieder zu einem Zeitsignal zusammengesetzt . . 

Verfahren, basierend auf Filterbank-Zerlegungen 



Das Gesamtbandsignal wird mittels einer Analysef liter- 
bank in einzelne Teilbander zerlegt. Hier konnen gleich- 

15 formige Filterbanke (alle Teilbander haben die gleiche 

Bandbreite) oder ungleichf ormige Filterbanke (ungleiche 
Bandbreite) eingesetzt werden. Die Gerauschunterdruckung 
wird im Teilbandbereich (bandpafigef ilterte, unterabge- 
tastete Zeitsignale) durchgef Uhrt . Mit einer Synthese- 

20 Filterbank wird aus den Teilbandsignalen wieder ein Ge- 

samtbandsignal generiert. Verfahren, die auf einer Wave- 
let-Zerlegung basieren, sollen aufgrund der haufig ver- 
wendeten Filterbankrealisierung ebenfalls zu dieser 
Klasse gehoren. 



4 



Verfahren, basierend auf Eigenwert-Zerlegungen 




Bei diesen Verfahren wird versucht, eine Eigenwert zerle- 
gung der Autokorrelationsmatrix des Eingangssignals 

30 durchzufuhren. Bei den zu den kleinen Eigenwerten geho- 

renden Eigenvektoren wird davon ausgegangen, dafi sie dem 
Gerauschanteil des Eingangssignals zugehorig sind. Diese 
werden zu Null gesetzt. Anschlieftend wird aus den modi- 
fizierten Eigenvektoren das gerauschreduzierte Ausgangs- 

35 signal gebildet. 
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Bei der oben genannten Aufteilung wurden aufgrund des Ver- 
gleichs mit dem erf indungsgemafien Verfahren lediglich die 
einkanaligen, passiven Verfahren berucksichtigt . Durch die 
Eigenwertanalyse sind Gerauschreduktionen nach dem letztge- 
nannten Prinzip sehr rechenauf wendig und benotigen lange Si- 
gnallauf zeiten und werden daher hier nicht weiter behandelt. 

Fur Gerauschreduktionsverf ahren ist eine hohe Frequenzselek- 
tivitat der Eingangssignalanalyse notwendig. Die hoherfre- 
quenten Signalanteile diirfen nicht durch Aliasing bei Filter- 
banken oder durch den Leck-Effekt bei DFT-Zer legungen gestort 
werden. Bei DFT-Zerlegungen fiihrt das zur Verwendung von Fen- 
sterfunktionen, die eine ausreichende Dampfung der Nebenmaxi- 
ma erreichen. Hierdurch wird aber ebenfalls der Hauptdurch- 
laftbereich verbreitert, was wiederum zu groI3en Blocklangen 
fiihrt. Es sind keine Verfahren bekannt, die mit Blocklangen B 
von lediglich B = 16 bei einer Abtast f requenz von f ab =B kHz 
arbeiten. Die Laufzeiten von bisherigen DFT-basierenden Ver- 
fahren sind damit deutlich grofier, als die durch die ITU vor- 
geschriebene Maximallauf zeit im Festnetzbereich von 2 ms. 

Das Problem der Nachbarkanaldampf ung kann durch Verwendung 
von Filterbankstrukturen gelost werden - allerdings mit dem 
Nachteil einer grofieren Laufzeit. Innerhalb des Analyse- 
Synthese-Sytems kann die Laufzeit in gewissen Grenzen aufge- 
teilt werden. Wird allerdings die Analysef ilterbank phasenmi- 
nimal entworfen, so fiihrt das zu einer phasenmaximalen Syn- 
thesef ilterbank, Auch mit reinen Filterbanksystemen lassen 
sich nicht die ITU-T-Forderungen nach der geringen Festnetz- 
lauf zeit erfullen . 

Das erfindungsgemafle Verfahren kombiniert eine Teilbandanaly- 
se (mit den Vorteilen der geringen Laufzeit von phasenminima- 
len Analysef ilterbanken) und eine Rucktransf ormation mittels 
einer inversen DFT. Die inverse DFT wird allerdings nicht auf 
das Signal, sondern in einer modif izierten Form auf die Teil- 
bandf ilterkoef f izienten angewendet. Die Forderung nach der 
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hohen Frequenzselektivitat aufgrund der leistungsstarken nie- 
derfrequenten Signalanteile bei Sprache und den damit verbun- 
denen Aliasing- oder Leckeffekten in den hoherf requenten Be- 
reichen kann hierdurch deutlich vermindert werden. Eine aus- 
fiihrlichere Beschreibung dieses Zusammenhangs folgt weiter 
unten. Die beschriebenen Schwierigkeiten bei geringen Block- 
langen konnen somit vermieden werden. Durch diese Kombination 
ist es moglich, eine Gerauschreduktion mit geringer Laufzeit 
und nur geringem Rechenaufwand (geringe Zahl der Frequenz- 
stlitzstellen) zu erreichen. 



Bevor mit einer detaillierten Verf ahrensbeschreibung begonnen 
wird, sind im folgenden die Eigenschaf ten des Freisprechver- 
fahrens bzw. des Verf ahrensteils , auf welchen sich die vor- 
liegende Erfindung konzentriert , tabellarisch aufgelistet. 

Das Verfahren zeichnet sich dadurch aus, daii 

nur sehr kurze Signallauf zeiten durch die Gerauschunter- 
druckung in den Signalpfad eingefiigt werden, 

die eigentliche Filterung im Vollbandbereich erfolgt, 
die Koef f izientenbestimmung ftir das Filter allerdings 
im Teilbandbereich durchgefuhrt wird, 

mehrere, unterschiedliche Abtastraten innerhalb des Ver 
fahrens verwendet" werden - (Mul t iratensystem)-, 

die Frequenzanalyse mittels einer Filterbank in Fre- 
quenzteilbandern implementiert wird, 

der Prototyptiefpafi der Filterbank phasenminimal ent- 
worfen wird, 




eine Kur zzeitleistungsschatzung mittels nichtlinearer 
Betragsglattungen der Teilbandsignale durchgefuhrt wird, 
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eine psychoakustische Gewichtung der geschatzten Summen- 
signalleistungen durchgefuhrt wird, 

eine nichtlineare Anhebung der Gerauschleistungs- 
5 schatzungen durchgefuhrt wird, 

eine automatische Verstarkungssteuerung verwendet wird, 
welche die Filterkoef f izienten so gewichtet, daii das 
gerauschreduzierte Signal ein naherungsweise gleiches 
0 Lautheitsempf inden hervorrufen. 

Die eigentliche Signalf ilterung zur Gerauschreduktion erfolgt 
durch ein kurzes Transversalfilter, welches im (Gesamtband-) 
Signalpfad plaziert wird. Die Gesamtbandf ilterung erfolgt ge- 
5 mali folgender Berechnungsvorschrif t : 

r(fc) = g(k)*x(k) 
= Z gXk)x(k-i). 

Mit g(k) wurde dabei der Filtervektor des Gesamtbandtransver- 
0 salfilters bezeichnet 

§_(*) = (go(k), gl (k),g 2 (k),...g N M)) T - 

Der Vektor A:(A:)beinhaltet die letzten N Abtastwerte des Ein- 
5 gangssignals des Gerauschunterdruckungsf ilters : 

x(k) = (x(k\ x(k - 1), x{k - 2),...jc(£ - + l)) r . 

Die Ordnung N-l des Transversalf ilters kann im Vergleich zu 
0 bisherigen Zeitbereichsverf ahren sehr gering gewahlt werden, 
z.B. N=16. 

Fur die Einstellung der Filterkoef f izienten wird eine Teil- 
bandzerlegung verwendet. Die Anzahl der Frequenzstiitzstellen 
5 sollte bei dem hier vorgestellten Verfahren gleich der Anzahl 
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der Filterkoef f izienten des Gesamtbandf ilters (N) sein. Die 
Dampfung eines Filterbandkanals gegenuber den anderen sollte 
so groli gewahlt werden, daii trotz der Kopplung der niedrigen 
Frequenzanteile durch Aliasing in den hoheren Frequenzen ein 
5 mittleres Signal-Aliasing-Verhaltnis von etwa 20 dB eingehal 
ten werden kann. Der Wert von 20 dB entspricht dabei dem Ma- 
ximalwert der Dampfung, welche die Gerauschunterdruckung ein 
fugen darf. 

10 In Fig, 6 ist zur Veranschaulichung ein gemitteltes Sprach- 
spektrum dargestellt. Es wurde ermittelt aus acht deutschen 
Sprachproben von jeweils vier Sprechern und vier Sprecherin- 
nen. Die Gesamtlange der Sprachprobe betrug etwa 50 s. Das 
Spektrum wurde berechnet, indem die Betragsquadrate der Fou- 

15 riertransf ormierten von Rahraen der Lange 1024 bei Gewichtung 
mit einem Hanning-Fenster gemittelt wurden . Das gemittelte 
Spektrum ist logarithmisch iiber der Frequenz aufgetragen. 

Aus dem gemittelten Sprachspektrum ist zu erkennen, dali be- 
20 reits eine Dampfung von etwa 40 dB notwendig ist, damit die 
nieder f requenten Signalanteile ein mittleres Signal-Aliasing 
Verhaltnis von 0 dB in den hoherf requenten Teilbandern erzeu 
gen. Zusammen mit der maximalen Dampfung der Gerauschunter- 
druckung sind somit Restkanaldampf ungen der Filterbank von 
25 etwa 60 dB notwendig. 

Bei der "Auswahl des Filterbanktyps sp'ielt die der" TmpTeritie- 
rung zugrundeliegende Hardware-Platt f orm eine wesentliche 
Rolle. Zwar konnen mit I IR-Filterbanken die vorgegebenen 

30 Dampf ungsanf orderungen mit sehr geringen Filterordnungen er- 
reicht werden, die Eigenschaf ten solcher Filterbanke sind al 
lerdings sehr anfallig gegenuber Rechenungenauigkeiten von 
Festkomma-Signalprozessoren. In den meisten Fallen muB von 1 
x 16 Bit-Multiplikationen, welche sehr schnell auf Consumer- 

35 Prozessoren durchgefiihrt werden konnen, zu 16 Bit x 32 Bit - 
oder gar zu 32 Bit x 32 Bit-Multiplikationen ubergegangen 
werden. Diese letztgenannten Multiplikationsf ormen benotigen 
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aber erheblich mehr Rechenauf wand, so dafi in deiti hier be- 
schriebenen Verfahren DFT-modulierte FIR-Polyphasenf ilterban- 
ke eingesetzt wurden. 

Das erf indungsgemafle Verfahren beruht auf der in "G. Wackers- 
reuther: Ein Beitrag zum Entwurf digitaler Filterbanke, Nr. 
64, Ausgewahlte Arbeiten uber Nachrichtensyteme, Erlangen, 
1987" vorgestellten Filterbankrealisierung . Die mit der Un- 
terabtastrate r unterabgetasteten Teilbandsignale werden ge- 
mafi den folgenden Berechnungsvorschrif ten bestimmt: 

v=0 

mit 

Das hochgestellte (r) soil dabei auf die Unterabtastung hin- 
weisen. Das tief gestellte p bzw. v wahlt dabei eines der 
Teilbandsignale aus dem Bereich 0...N-1 aus . Da die kom- 
plexwertigen Signale (n) aus einem reellwertigen Signal 

jc(&) berechnet wurden, konnen die oberen Frequenzbandsignale 
durch komplexe Konjugation aus den unteren Teilbandern be- 
stimmt werden. Um die fur die Berechnungsvorschrif t notwendi- 
gen Zwischensignale u[ r) (n) zu berechnen, werden zunachst fol- 

gende Hilfssignale eingefuhrt: 

x^\n) = x{nN-p) 
h™(n) = h TP {nN + p) 

mit n^p e Z (Menge der ganzen Zahlen) . 

Mit h TP (k) wurde dabei die Impulsantwort des der Filterbank 
zugrundeliegenden sog. Prototyptief passes bezeichnet. Mit den 
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Hilfsgroflen X ( p N) (n) und h { p N) (n) kann die Berechnung der Zwi- 
schensignale V { ?{ri) wie folgt angegeben werden: 



5 




Mit N TP - 1 wurde dabei die Ordnung des Prototyptief passes be 
zeichnet. In Fig. 7 ist eine Strukturdarstellung der Filter- 
bankberechnung dargestellt. Lediglich das Fullen des Ein- 

10 gangsspeichers erfolgt mit der vollen Abtastrate - alle wei- 
teren Berechnungen (Faltung und inverse DFT) werden nur un- 
terabgertastet durchgef uhrt . Die zunachst komplex erscheinen 
de Indizierung der Hilfsgroflen kann selbst auf einfachen Si- 
gnalprozessoren effizient durchgefuhrt werden, ohne explizit 

15 jede einzelne Division bzw. Modulo-Berechnung auszufuhren. 

Aus den Teilbandsignalen X { ^(ri) werden durch nichtlineare Be- 

tragsglattungen Schatzwerte der Kurzzeitleistungen gebildet. 
Die Betragsbildung wird hierbei aus Auf wands- und Speicher- 
20 grunden gemafl der folgenden Berechnungsf orm angenahert: 



25 Die eigentlichen Kurzzeitschatzwerte werden durch nichtlinea 
re IIR-Filterungen erster Ordnung gebildet: 



x 



Xr) 
/j,abs 



(n) = \ Re{<>(«)} | + | Im 



*i° (»)| = ft, («) <L (") + (!-/?„ («)) \*V (n - 1) . 



30 



Die Zeitkonstante ^(rt)wird dabei so gewahlt, dafl einem Lei- 

stungsanstieg schnell und einem Leistungsabf all langsam ge- 
folgt werden kann: 
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/?» = 



fir, /^<1(")>|<>-1)| 

P f , sonst 



mit0<j3 r </3 f <1. 



Durch die Wahl von unterschiedlichen Zeitkonstanten soil dem 
psychoakustischen Effekt der zeitlichen Nachverdeckung Rech- 
nung getragen werden. Ein plotzlicher Anstieg der Signallei- 
stungen wird von dem Gerauschunterdriickungsverfahren als ein- 
setzende Sprache interpretiert . In solchen Fallen wird eine 
bereits eingefugte Dampfung schnell zuriickgenommen . Bei einera 
plotzlichen Abfall der Signalleistungen wird vom Ende eines 
Sprachsegments ausgegangen. Durch den zeitlichen Verdeckungs- 
effekt ist das menschliche Ohr nun kurzzeitig unempf indlich 
gegen das verbleibende Hintergrundgerausch . Die Dampfung der 
Gerauschreduktion kann somit langsamer wieder eingefiigt wer- 
den als sie zu Beginn der Sprachpassage zuruckgenommen wurde . 

Neben der zeitlichen Verdeckung kann auch der Effekt der Fre- 
quenz- bzw. der Simul tanverdeckung zur Verringerung von 
Sprachver zerrungen ausgenutzt werden. Zu diesem Zweck werden 
die geschatzten Signalleistungen psychoakustisch bewertet. 



Im Gegensatz zu Sprachcodierungsver f ahren (z.B. MPEG-Audio- 
Codierung) wird hier von einem sehr einfachen psychoakusti- 
schen Model! ausgegangen. Da in- den niedrigen Frequenzberei- 
chen oftmals nur sehr schlechte Signal-Gerausch-Verhaltnisse 
anzutreffen sind, wird die Suche nach Maskierungssignalen nur 

7t 3ttT) 

— , durchgef iihrt . Hoher f requente 

N N ) 



im ersten Teilband Q e 



Bereiche werden aus Auf wandsgrtinden nicht in die Suche mit 
einbezogen. Die Mithorschwelle wird vom Maskierungssignal un- 
abhangig angenommen und durch eine logarithmische Kennlinie 
angenahert . 
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Fur die modif izierten Schatzungen der Kurzzeitteilbandlei- 
stungen ergibt sich damit im untersten Teilband (/J = 0) : 



\xr(n)\= Max [\x^(n)\ ,y ver y ^ \x[ r \n)\\ 



5 

Fur die oberen Teilbander JU eN 2...— >\ ergibt sich entspre- 



10 

In Fig. 8 ist die verwendete psychoakustische Gewichtung noch 
einmal schematisch dargestellt. Im linken Teil der Abbildung 
ist das Spektrum eines kurzen Ausschnitts (128 Takte) aus ei- 
nem Sprachsignal sowie die mittleren Teilbandpegel (Balken) 
15 dargestellt. Ausgehend vom ersten Teilband (250 Hz bis 750 Hz 
bei f ab = 8 kHz und N = 16) wird eine Maskierungskurve gene- 
riert. Hierzu wird der Pegel im Band jj = 1 zunachst Lim den 
Faktor y ^ abgesenkt, Ausgehend von diesem Ref erenzpunkt 

werden die Mithorschwellen durch logarithmisch abfallende 
20 Kurven angenahert. Dies ist im rechten Teil der Abbildung 
durch die Punkte symbolisiert . Liegen die gemessenen Teil- 
bandpegel unterhalb der angenaherten Mithorschwelle , so er- 
folgt durch Max imumbil dung eine kunstliche TVnhebung. 

25 Zur Schatzung der Hintergrundgerauschleistungen wird eine 

sog. Minimumstatistik ausgewertet. Dieses Verfahren benotigt 
im Gegensatz zu den meisten anderen Verfahren zur Gerausch- 
schatzung keinen Sprachpausendetektor . 

30 Das implementierte Verfahren zur Gerauschleistungsschatzung 

verwendet Schatzf enster der Lange N M s (r N M s) Takte. Innerhalb 
eines solchen Fensters wird durch Vergleichsoperationen das 
Minimum der geschatzten Eingangsleistung in jedem Teilband 
bestimmt : 




chend: 
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|<L(«)| = 



M/«{|jc^ («)|, (/? - 1)|} falls n mod N MS * 1 



sonst 



Die Gerauschschatzung wird mehrstufig ausgefuhrt, d.h. die 
Minima der vergangenen Mms Schatzf enster werden gespeichert. 
Das Erneuern der gespeicherten Blockminima erfolgt gerade ei- 
nen Unterabtasttakt bevor in Gleichung 2.4 die Erneuerungsbe- 
dingung (n mod N MS = 1) erf ullt ist. Die vergangenen Minima 

n^(n)\bis 



n 



(ri) werden gemafi der folgenden Speichervor- 



schrif t gesi chert : 



\n 



(O 



(" - 



falls n mod N MS = 1 
sonst 



15 




20 



0)1 = 



<?(«-l)|, 



K»|= 



<L(«)|> 



0-4 



« mod = 1 

sonst 

falls n mod TV^ = 1 
sonst 



Die eigentliche Schatzung der Gerauschleistung in jedem Teil- 
band erfolgt durch eine Minimumsuche uber die gespeicherten 
Blockminima und das aktuelle Blockminimum: 



<1(«)|= 



Min {|<|(#i)|,..., fallsnmod N MS = 

^{KlHK--^- 1 )!}' sonst 



Durch diese Form der Minimumsuche kann der Berechnungsaufwand 
25 minimal gehalten werden. Pro Unterabtastung und Teilband sind 
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zunachst nur zwei Vergleiche durchzuf iihren . Hiermit werden 
die Grofien 



und W ^L( W )| aktualisiert . Erst wenn N MS 

neue Signalwerte eingetroffen sind, erfolgt eine weitere Ak- 
tualisierung . Die vergangenen Blockminima werden lediglich 
"weitergeschoben" und das aktuelle Blockminimum wird in den 
ersten Verzogerungsspeicher kopiert. In Fig. 9 ist die Struk- 
tur der Berechnung dargestellt. 



Das "Gedachtnis" der hier vorgestellten Gerauschleistungs- 
10 schatzung variiert mit der Zeit - das minimale Gedachtnis be 
zieht sich auf {r Nms Mms) Gesamtbandtakte, maximal kann auf 
die vergangenen (r (Mm S +1) ) Gesamtbandtakte zuruckgegrif- 
fen werden. Die mittlere Gedachtnisdauer von (r N M s (M MS + h) ) 
sollte so grofi gewahlt werden, dafi mit grofier Wahrscheinlich- 
15 keit zumindest eine Sprachpause enthalten ist. Andererseits 
darf das Gedachtnis nicht zu grofi gewahlt werden, da sonst 
einem Anstieg der Gerauschleistung nur verspatet gefolgt wer- 
den kann. Zeitraume von 3 bis 5 Sekunden haben sich hier als 
akzeptabel herausgestellt . 

20 

Sollte mit den bisherigen Schatzwerten fur die Summensignal- 
leistungen und die Gerauschleistungen ein Gerauschreduktions- 
filter gemafi einem Wiener-Ansatz im Frequenzbereich einge- 
stellt werden, so fuhren die unterschiedlichen "Tragheiten" 

25 der Schatzungen zu horbaren Artefakten. In Passagen ohne 

Sprachaktivitat f olgen die Su^enleistungsschat zungen . den_„ 
Kurzzeitschwankungen der Gerauschpegel relativ schnell - die 
Gerauschschatzungen detektieren lediglich die Minima und sind 
daher naherungsweise konstant. Die resultierenden Dampfungen 

30 sind in solchen Passagen zwar relativ hoch, die Pegelschwan- 
kungen der Summensingalschatzer fuhren aber dennoch zu gerin- 
gen Schwankungen der Dampf ungsf aktoren . Am Ausgang der Ge- 
rauschreduktion ist dies als sog. "musical tones" zu horen. 




35 Bisher bekannte Verfahren zur Sprachverbesserung verwenden 
zur Vermeidung dieser Artefakte eine Glattung der Summensi- 
gnalpegel in Fequenzrichtung. Hierbei werden meist IIR-Filter 
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erster Ordnung mit niedriger Glattungskonstante oder nichtli- 
neare Medianfilter niedriger Ordnung eingesetzt. 

In dem hier beschriebenen Verfahren wird ein anderer Weg ein- 
5 geschlagen - es werden nicht die Summensignalpegel sondern 

die Gerauschpegelschatzungen in einer weiteren Verf ahrensstu- 
fe verandert. 



Die Gerauschleistungsschatzwerte werden zunachst logarith- 
0 miert. Hierzu wurde eine spezielle Hardware-Logari thmierung, 
welche in "A. Hauenstein: Implementierung eines Freisprechal- 
gorithmus auf dem Siemens DSP-Core SPC, Diplomarbeit D 103, 
Darmstadt, 1995" beschrieben ist, verwendet. Im folgenden 
wird diese Funktion durch LOG ( . . . ) abgekiirzt, es gilt nahe- 
5 rungsweise: 

LOG(x)^K\og ]0 \x[ 



Die nichtlineare Gerauschpegelanhebung wird wie folgt durch- 
0 gefuhrt: 

LOG^\n)\) = ZOG(|<l(«)|) + A^ G («) 
mit jj e |o,...,yJ. 

5 • " - 

Die Pegelanhebung A ( ^ G (/?) wird in alien Teilbandern gleicher- 
maBen verwendet. Sobald eine Sprachaktivitat in dem ver- 
rauschten Summensignal festgestellt wird, erfolgt eine 
schnelle Absenkung der Pegelanhebung. Sollte keine Sprachak- 

0 tivitat detektiert werden, erfolgt ein langsames Anheben der 
Grofle A nLOC (n) . Die Pegelanhebung wird sowohl durch einen Ma- 

ximalwert als auch durch einen Minimalwert begrenzt: 
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Min {A^XA^Oi - 1) + A J}, falls \x?{n)\ < \x^{n)\ 
Max {A M „,(C(« - 1) - A dek )}, sonst 



Durch die additive Nachfuhrung der Pegelanhebung konnen kurz- 
zeitige Fehldetektionen der Sprachaktivitatserkennung tole- 
5 riert werden. Fur das Pegelinkrement A ink bzw. fur das Pegel- 
dekrement A^ gilt: 

A IBfc < A A , . 

10 Fur die beiden Begrenzungswerte A^und A^ haben sich fol- 
gende Einstellungen bewahrt: 

A Win * 5dB, 

A Max * 

15 Die Untergrenze von etwa 5 dB gleicht dem systematischen Feh- 
ler, der durch die Minimumbestimmung bei der Gerausch- 
schatzung entsteht, wieder aus. Diese Korrektur hangt vor al- 
lem von den Zeitkonstanten der IIR-Glattungsf ilter ab - bei 
Veranderungen der Zeitkonstanten sollte die Untergrenze er- 

20 neut angepafit werden. Die Entscheidung, ob Sprachaktivitat 

detektiert wird, hangt von der Wahl der Konstante K A ab . ^^^J 
Hierbei sollte die Summensignalleistung mindestens etwa 15 c^^^^P 
lib e r- de r - g e s Gha-tz-t-en Ge r au s ch ,1 e i s t ung- lie gen v ™um - ein-^-^ s en k en- - 
der Pegelanhebung auszulosen. Fur die Konstante AT A gilt so- 

25 mit: 

Fiir die Reduktion der Hintergrundgerausche werden zunachst 
30 die Unterdruckungsf aktoren in jedem Teilband b^\ri) bestimmt. 

Hierfur wird nach einem parametrisierten Wiener-Ansat z vorge- 
gangen. 
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Das hier vorgestellte Verfahren verwendet die folgende Kenn- 
linie zur Bestimmung der Teilbandf aktoren: 

b?{n) = Max {b Min \a%(n)(l - LIN {b^ OG (nj\ )]}. 

5 

Die errechneten Dampfungsf aktoren werden auf einen linearen 
Minimalwert bmn begrenzt . Bei zu klein gewahlten Begrenzungs- 
werten nehmen die Sprachverzerrungen zu. AuiJerdem verliert 
der feme Gesprachsteilnehmer den akustischen Umgebungsein- 
10 druck. Eine Begrenzung von etwa 20 dB hat sich hier als gun- 
stiger Wert herausgestellt . Es lafit sich damit eine Sprach- 
verbesserung erzielen, ohne zu grofle Sprachverzerrungen zu 
erhalten. Auiierdem bleibt die akustische Hintergrundinf orma- 
tion (z.B. der Teilnehmer befindet sich in einem Kfz) erhal- 
15 ten, ohne dali die vorhandenen Restgerausche die Unterhaltung 
storend beeintrachtigen . 

Die Berechnung der eigentlichen Unterdruckungsf aktoren wird 
mit logarithmischen Grolien durchgef uhrt . Vor der Begrenzung 

20 mussen diese Werte wieder in den linearen Bereich uberfiihrt 
werden. Dies geschieht analog zur Logarithmierung mit einer 
Naherungsform, die in "A. Hauenstein: Implementierung eines 
Freisprechalgorithmus auf dem Siemens DSP-Core SPC, Diplomar- 

^ beit D 103, Darmstadt, 1995" erlautert ist: 

LIN(x)~\0 x,K . 

Die Konstante K ist dabei die gleiche wie bei der Logarith- 
mierung. Vor der Begrenzung der HilfsgrofJen wird ein Dam- 
30 pfungsausgleich a ( ^(n) einmultipliziert . Die Bestimmung die- 
ser GroUe ist weiter unten beschrieben. Hiermit soil ein an- 
nahernd gleiches Lautheitsempf inden fur das gerauschreduzier- 
te und das gerauscherf ullte Signal erreicht werden. 



35 



Die logarithmischen GroJJen b^ LOG (n) werden wie folgt bestimmt: 
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10 



Kloei") = Min [0^\LOG§K\n)§- LOG 

(„) = M» {o,^J[LOG^(n)fj-LOG (^(^j)]}, 




Durch die so.g. Uberschatzungsf aktoren 3 us ,o und J5 us ,i kann die 
"Aggressivitat" der Ger aus chunt erdrtic kung beeinflufit werden. 
Sollten diese Faktoren grolier als eins gewahlt werden, wird 
die Pegeldif f erenz zwischen der Summensignalpegel- und der 
Gerauschpegelschatzung kunstlich vergrofiert und es wird mehr 
Dampfung eingefugt. Da die meisten Fahrzeuggerausche in nied- 
rigen Frequenzbereichen zu einem sehr schlechten Signal- 
Gerausch-Verhaltnis fiihren, kann die Oberschatzungseinstel- 
lung im niedrigsten Teilband (0 Hz bis 250 Hz bei N = 16 und 
15 f ab = 8 kHz) getrennt von den ubrigen Teilbandern gewahlt 

werden. Durch die Begrenzung wird verhindert, daii die endgiil- 
tigen Faktoren b^\n) einen Wert grolier als eins annehmen 



konnen . 

20 In Fig. 10 ist ein Beispielverlauf fur die Dampfung in einem 
Teilband skizziert. Ausgehend von dem verrauschten Gesamt- 
bandsignal, welches im oberen Teil der Fig. 10 dargestellt 
ist, sind zunachst die geschatzten und bewerteten Kurzzeit- 

leistungen des Summensignals LOG^X^(n)^j und des Gerausches 

25 LOG^ (r) («)|j dargestellt (mittlerer Teil der Abbildung) . Die 

nichtlineare Gerauschpegelanhebung ist im Bereich von 1,5 Se- 
kunden bis 2,7 Sekunden deutlich zu erkennen. Zu Beginn des 
Sprachsignals wurde die Gerauschanhebung nicht aktiviert. Die 
hieraus resultierenden Dampf ungsschwankungen (musical tones) 
30 sind im unteren Teil der Abbildung im Bereich von 0 Sekunden 
bis 0,15 Sekunden deutlich zu erkennen. Die Gerauschreduktion 
wurde auf einen Maximalwert der Dampfung von 30 dB begrenzt. 
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Durch den folgenden Teil des Verfahrens wird versucht, die 
Teilbanddampfungsf aktoren so zu beeinf lussen, dafi ein glei- 
ches Lautheitsempf inden des gerauscherf ullten und des ge- 
rauschreduzierten Signals hervorgeruf en wird. Hierbei wird 
davon ausgegangen, dali das gestorte Sprachsignal zumindest in 
kurzen Zeit- und Frequenzabschnitten einen grolieren Nutzsi- 
gnalpegel aufweist als das Hintergrundgerausch . Um den beno- 
tigten Rechenauf wand gering zu halten, wird lediglich im 
zweiten Teilband nach leistungsstarken Signalanteilen ge- 
sucht • Sollte die Kurzzeitleistung in diesem Teilband um ei- 
nige Dezibel uber dem geschatzten Hintergrundgerauschpegel 
liegen, so wird zunachst ein Dampfungsf aktor ohne Biasaus- 
gleich r) DA (n) bestimmt. Dieser wird dann invertiert und ei- 

ner rekursiven Glattung zugefiihrt: 



a 



(»)= 



i 



P» A (n - 1), falls |*<" (n)\ > K DA \n? (n)\ 



sonst 



mit 0 < 3 DA < 1 



20 




Der vorlaufige Teilbanddampfungsf aktor wird wie folgt be- 
stimmt : 

= Max[b Min \{\-LIN{b£ OG („)})]} 



25 



mit 



Die Grofle t>2,Loo( n ) kann dabei als Zwischenergebnis aus der 
30 Teilbandkoef f izientenbestimmung ubernommen werden. 
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letzten Verf ahrensabschnitt werden aus den bisher 



berechneten Teilbandkoef f izienten die Gesamtbandf ilterkoef f i- 
zienten bestimmt. Die unterschiedlichen Abtastraten werden 
durch einfaches Beibehalten der alten Gesamtbandkoef f izienten 
5 uberbriickt. Da sich die Teilbandkoef f izienten durch die IIR- 
Glattungen nur sehr langsam andern, wird auf eine aufwendige 
Anti-Imaging-Filterung verzichtet. Die Filterkoeff izienten 
werden gemafi der in Fig. 11 dargestellten Berechnungsf orm 
. eingestellt . Bei dieser Berechnungsf orm wurden die Reellwer- 
10 tigkeit und die Symmetrie der Teilbandkoef f izienten verwen- 
det . 





0 
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Paten tanspruche 

1. Vorrichtung zur Gerauschunterdruckung in Fernsprechein- 
richtungen, dadurch gekennzeichnet, dafl 

5 im Sendepfad der Fernsprecheinrichtung ein zusatzliches Fil- 
ter mit extrem kurzer Laufzeit angeordnet ist. 

2. Vorrichtung nach Anspruch 1, dadurch gekenn- 
zeichnet, dafl auch im Empf angspf ad der Fernsprechein- 

10 ; richtung ein sblches zusatzliches Filter mit extrem kurzer 
Laufzeit angeordnet ist. 

^1^^^ 3. Vorrichtung nach Anspruch 1 oder 2, dadurch g e- 
V^^V kennzeichnet, dafl das oder die zusatzlichen Filter 
15 eine Gruppenlauf zeit von < 2 ms aufweisen. 

4. Vorrichtung nach Anspruch 1, 2 oder 3, dadurch 
gekennzeichnet, dafl das oder die zusatzlichen 
Filter einstellbare Koef f izienten aufweisen und eine Steuer- 

20 schaltung zur Einstellung der Koef f izienten vorgesehen ist. 

5. Vorrichtung nach Anspruch 4, dadurch gekenn- 
zeichnet, dafl das oder die zusatzlichen Filter im 
Vollbandbereich arbeiten, wahrend die Steuerschaltung zur 

25 Koef f izienteneinstellung im Teilbandbereich arbeitet. 

^^^B 6. Vorrichtung nach Anspruch 5, dadurch gekenn- 
zeichnet, dafl in der Steuerschaltung das Eingangs- 
signal mit einer DFT-modulierten Polyphasenf ilterbank (130) 
30 mit phasenminimalem Prototyptiefpaflf ilter verbunden ist. 

7. Vorrichtung nach Anspruch 6, dadurch gekenn- 
zeichnet, dafl die unterabgetasteten Ausgangssignale 
der Polyphasenf ilterbank (130) an eine Kurzzeitleistungs- 

35 schatzungsvorrichtung (132) angeschlossen sind. 

8. Vorrichtung nach Anspruch 7, dadurch gekenn- 
zeichnet, dafl die Ausgange der Kurzzeitleistungs- 
schatzungsvorrichtung (132), die die Schatzwerte der Teil- 
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bandleistungen tragen, mit einer Vorrichtung zur Schatzung 
. der Leistungen des Hintergrundgerausches und einer Vorrich- 
tung (134) zur psychoakustischen Gewichtung der gestorten 
Teilbandleistungen verbunden sind. 

5 

9. Vorrichtung nach Anspruch 8, dadurch gekenn- 
zeichnet, dali die Ausgange der Vorrichtung zur 
Schatzung der Leistungen des Hintergrundgerausches liber eine 
Vorrichtung zur nichtlinearen Anhebung der Gerauschsignale 

10 uhd die Ausgange der Vorrichtung (134) zur psychoakustischen 
Gewichtung direkt mit einer Vorrichtung zur Berechnung der 
Teilbandgewichtungsf aktoren verbunden sind. 

10. Vorrichtung nach Anspruch 9, dadurch gekenn- 
15 zeichnet, dali die Ausgange der Vorrichtung zur Berech 

nung der Teilbandgewichtungsf aktoren mit einer Vorrichtung 
zur modif izierten inversen diskreten Fouriertransf ormation 
verbunden sind, deren Ausgang mit dem Koef f izienteneingang 
des oder der zusatzlichen Filter (31, 33) verbunden ist. 

20 

11. Vorrichtung nach Anspruch 9 oder 10, dadurch g e- 
kennzeichnet, daft zumindest ein Teil der Ausgange 
der Kurzzeitleistungsschatzungsvorrichtung (132) mit einer 
Vorrichtung (136) zum Dampf ungsausgleich verbunden sind, de- 

25 ren Ausgang mit einem Steuereingang der Vorrichtung zur Be- 
rechnung der Teilbandgewichtungsf aktoren verbunden ist. 

12 . Vorrichtung nach Anspruch . 1 2 oder _3 d_ a . d_ u r c h 
gekennzeichnet, dali es sich bei dem oder den zu 
30 satzlichen Filtern (31, 33) urn kurze Transversal filter han- 
delt, vorzugsweise mit einer sehr geringen Ordnung < 20. 

13. Verfahren zur Gerauschunterdruckung in Fernsprecheinrich 
tungen, dadurch gekennzeichnet, dali das 

35 Sendesignal der Fernsprecheinrichtung einer zusatzlichen Fil 
terung mit sehr geringer Laufzeit unterworfen wird. 

14. Verfahren nach Anspruch 13, dadurch gekenn- 
zeichnet, dali auch das Empf angssignal der Fernsprech- 
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einrichtung einer solchen zusat zlichen Filterung mit sehr ge- 
ringer Laufzeit unterworfen wird. 

15. Verfahren nach Anspruch 13 oder 14, dadurch g e~ 
5 kennzeichnet, daJi die Gruppenlauf zeit fiir die zu- 

satzlichen Filterungen auf weniger als 2 ms eingestellt wird. 

16. Verfahren nach Anspruch 13, 14 oder 15, dadurch 
gekennzeichnet, dafi die Filterung mittels kurzer 

10 Transversalf iltef (31-, 33) durchgeflihrt wird, deren Ordnurig 
vorzugsweise < 20 ist. 




17. Verfahren nach Anspruch 14 und 16, dadurch ge- 
kennzeichnet, daft die Transversalf ilter (31, 33) 



15 mit einstellbaren Koef f izienten gesteuert werden, die fiir 

beide Transversalf ilter (31, 33) gleich eingestellt werden. 

18. Verfahren nach Anspruch 17, dadurch gekenn- 
zeichnet, dafl die Filterung im Vollbandbereich durch- 

20 geflihrt wird, wahrend die Bestimmung der Koef f izienten im 
Teilbandbereich durchgeflihrt wird. 

19. Verfahren nach Anspruch 18, dadurch gekenn- 
zeichnet, dafi mehrere, unterschiedliche Abtastraten 

25 innerhalb des Verfahrens verwendet werden. 

^^^B 20. Verfahren nach Anspruch 18 oder 19, dadurch ge- 

kennzeichnet, dafi die Bestimmung der Koef f izienten 
mittels einer Teilbandanalyse und einer Rucktransf ormation 
30 mittels einer modif izierten inversen diskreten Fouriertrans- 
f ormation (DFT) erfolgt. 

21. Verfahren nach Anspruch 20, dadurch gekenn- 
zeichnet, dali die modifizierte diskrete Fouriertrans- 
35 formation auf die Teilbandf ilterkoef f izienten angewendet 
wird. 



22. Verfahren nach Anspruch 20 oder 21, dadurch ge- 
kennzeichnet, dafl die Teilbandanalyse mittels ei- 
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ner Filterbank (130) in Frequenzteilbandern implementiert 
wird. 

23. Verfahren nach Anspruch 22, dadurch gekenn- 
zeichnet, dali die Filterbank (130) als DFT-modulierte 
Polyphasenfilterbank mit phasenminimalem Prototyptief paiif li- 
ter ausgefiihrt wird. 

24. Verfahren nach einem der Anspruche 20 bis 23, d a- 

d u r c h g e k e n n z e i c h n e t, dali bei der Bestim- 
mung der Koef f izienten zusatzlich eine Kurzzeitleistungs- 
schatzung mittels nichtlinearer Betragsglattungen der Teil- 
bandsignale durchgefuhrt wird. 

25. Verfahren nach Anspruch 24, dadurch gekennzeichnet , dali 
bei der Bestimmung der Koef f izienten zusatzlich eine psychoa- 
kustische Gewichtung (134) der geschatzten Summensignallei- 
stungen durchgefuhrt wird. 

26. Verfahren nach Anspruch 24 oder 25, dadurch gekennzeich- 
net, dali bei der Bestimmung der Koef f izienten zusatzlich eine 
nichtlineare Anhebung der Gerauschleistungsschatzungen durch- 
gefuhrt wird. 

27. Verfahren nach Anspruch 24, 25 oder 26, dadurch 
gekennzeichnet, daii bei der Bestimmung der 
Koef f izienten zusatzlich eine automatische Verstarkungssteue 
rung. (136) verwendet wird,. welche die Filter koef f izienten so 
gewichtet, dali das gerauscher f ullte und das gerauschreduzier- 
te Signal ein naherungsweise gleiches Lautheitsempf inden her- 
vorruf en . 
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Zusammenfassung 

Vorrichtung und Verfahren zur Gerauschunterdruckung in Fern- 
sprecheinrichtungen 

Vorrichtung und Verfahren zur Gerauschunterdruckung in Fern- 
sprecheinrichtungen, insbesondere mit Freisprecheinrichtung, 
mit einer Pegelwaage, wobei im Sende- und Empfangspfad der 
Fernsprecheinrichtung ein zusatzliches Filter mit einer Grup- 
penlaufzeit von weniger als 2 ms eingesetzt ist. 
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